ارائه الگوریتمی برای حفظ محرمانگی داده ها در مقابل فرایند استخراج الگوهای پدیدارشونده حساس میان دو مجموعه داده

پایان نامه
چکیده

جمع آوری و نگهداری حجم بزرگی از داده های مرتبط در کاربردهای گوناگون تجاری و صنعتی، این فرصت را به صاحبان داده می دهد تا بتوانند با استفاده از روش های پیچیده داده کاوی به تحلیل و استخراج دانش موجود در این داده های خام پرداخته و از نتایج حاصل در راستای رشد و ترقی خود و یافتن برتری نسبت به رقبا، استفاده کنند. تمایز کاوی یکی از روش های جدید داده کاوی است که هدف آن کشف کردن تمایزهای میان دو یا چند مجموعه داده می باشد. این دانش به تازگی مورد مطالعه پژوهشگران قرار گرفته است. داده کاوی با هدف حفظ محرمانگی زمینه پژوهش ها نوینی است که به بررسی اثرهای جانبی بکارگیری روش های داده کاوی در نفوذ به محرمانگی افراد یا سازمان ها می پردازد. در این راستا، تاکنون پژوهش های با محوریت حفاظت از محرمانگی انجام پذیرفته است. هدف از این پژوهش ها بدست آوردن اطمینان از جامعیت استفاده از داده کاوی در عین محرمانه ماندن اطلاعات کاربران است. تمایز کاوی با هدف حفظ محرمانگی همانند داده کاوی به بررسی اثرهای جانبی بکارگیری روش های تمایزکاوی در نفوذ به محرمانگی افراد یا سازمان ها می پردازد. در بین تحقیقاتی که تا کنون انجام شده است، تحقیقاتی پیرامون محرمانگی در تمایز کاوی وجود ندارد و یا به ندرت یافت می شود. پرسش اصلی این است که نتایج مفید و معتبر در فرآیند تمایزکاوی، بدون آنکه محرمانگی داده ها مورد تهدید واقع شود، چگونه دستیابی پذیرند. در واقع از یک سو باید به کمک روش هایی از استخراج دانش حساس جلوگیری کرد و از سوی دیگر دقت نمود که این کار بر روی کیفیت دانش غیر حساس استخراج شده از پایگاه داده تأثیر منفی نگذارد. مساله حفاظت کامل از محرمانگی اطلاعات با حفظ کیفیت داده ها، از جمله مسائل np-hard می باشد. بنابراین در بسیاری از موارد یافتن جواب قطعی برای آن کاری بسیار زمانبر و در پاره ای از اوقات تقریبا غیر ممکن است. بدین منظور در این پژوهش سعی بر آن شده است که‎ ‎حفظ‎ ‎محرمانگی‎ ‎داده ها‎ ‎در‎ ‎مقابل‎ ‎فرآیند‎ ‎استخراج‎ ‎نوعی از الگوی تمایزی به نام الگوی پدیدارشونده ‏ میان دو مجموعه داده مورد توجه قرار گیرد و برای آن الگوریتم هایی ارائه می گردد تا علاوه بر جلوگیری از افشاء اطلاعات حساس، کیفیت و اصالت داده ها نیز محفوظ باقی بماند. این الگوریتم ها از تابع بهینه سازی با چندین هدف سود برده و پنهان سازی الگوهای پدیدارشونده حساس را با ساختار درختی کارا، درخت zbdd انجام می دهد. درخت zbdd ساختاری کارا برای یافتن الگوهای پدیدارشونده است که پیچیدگی زمانی کمی نسبت به سایر روش های ارایه شده دارد. این ساختار به خصوص برای داده های تنک مناسب است. کارایی الگوریتم های پیشنهادی با انجام آزمایش و مقایسه های مختلف نشان داده شده است

منابع مشابه

حفظ محرمانگی داده ها در داده کاوی

داده کاوی فرآیند انتخاب، اکتشاف و مدل کردن مقدار زیاد و متنوعی از داده ها برای کشف قوانین و ارتباط بین آنها به منظور استخراج نتایج مفید برای صاحبان پایگاه داده ها است. دانش حاصل از داده کاوی موضوع جدیدی است که اخیراً در پایگاه داده ها مطرح شده است. این دانش، از اطلاعات شخصی افراد استخراج می شود. در سال های اخیر روش های داده کاوی با معضل مهم محافظت از داده های حساس، از جمله داده های بانکی، پزشکی ...

ارائه روشی مبتنی بر آشفتگی جهت کاوش داده های حساس با حفظ محرمانگی

با پیشرفت های اخیر در فرایند ارتباطات و ذخیره سازی داده، میزان زیادی از اطلاعات جمع آوری و ذخیره شده است. چنین میزان گسترده ای از داده ها فرصت های زیادی برای کشف دانش ایجاد می کنند. اگرچه، اطلاعات تقریبا همیشه تحت برخی ملاحظات حفظ حریم خصوصی جمع آوری شده است، اما در سال های اخیر افزایش نگرانی ها درمورد محرمانگی باعث شده است که صاحبان داده ها تمایل به اشتراک گذاری داده هایشان و ایجاد انباره های ...

15 صفحه اول

ارائه مدلی جهت حفظ محرمانگی در پردازش داده های کلان

امروزه منابع اطلاعاتی به منابعی مشخص و از پیش تعیین شده محدود نمی شوند و هرگونه اطلاعی همچون ترافیک شبکه، اطلاعات مربوط به پست الکترونیک، رفتار مشتری در هنگام خرید و سایر موارد، می توانند به عنوان یک منبع اطلاعاتی قابل توجه، مد نظر قرار گیرند. بنابراین، برای سازگاری با این عصر جدید در داده ها که به عنوان عصر داده های کلان مطرح می شود، نیازمند زیرساخت ها و تکنیک های جدیدی هستیم که بتوانند با ویژ...

زمانبندی در محاسبات ابری ترکیبی با حفظ محرمانگی داده ها

به کار گیری فناوری ابرهای محاسباتی از بدو ابداع تا به امروز رو به رشد بوده و این روند با شتاب ادامه دارد. در این میان کلیه سازمانهای تجاری و تحقیقاتی در ابعاد بزرگ، متوسط و یا حتی کوچک خواهان این هستند که خود را با این فناوری که در مرزهای علم قرار گرفته است تطبیق دهند. استفاده از ابر خصوصی برای اجرای برنامه های جریان کاری ، کاهش هزینه و محرمانگی بیشتر اطلاعات سازمان را به دنبال خواهد داشت؛ در ح...

فرایند حفظ حریم بیماران: یک نظریه داده بنیان

Introduction: Ethics, customs, and divine and human values in all scientific and non-academic issues are accepted among all human societies in different eras. The purpose of this study was to understand the experiences of nursing professionals about the patient's privacy. Methods: 21 participants were selected by theoretical sampling which was guided by emerging categories. All participants we...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

دانشگاه تربیت معلم - تهران - دانشکده مهندسی کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023